Giải trình tự nanopore là gì? Nghiên cứu khoa học liên quan

Giải trình tự nanopore là công nghệ xác định trình tự DNA hoặc RNA bằng cách đo biến đổi dòng điện khi phân tử đi qua một lỗ nano ở cấp độ phân tử và không cần khuếch đại PCR. Công nghệ này thuộc nhóm giải trình tự thế hệ mới, cho phép đọc trực tiếp các đoạn trình tự rất dài theo thời gian thực và phản ánh cấu trúc sinh học nguyên bản của axit nucleic.

Khái niệm giải trình tự nanopore

Giải trình tự nanopore là một công nghệ giải trình tự axit nucleic thế hệ mới, cho phép xác định trực tiếp trình tự DNA hoặc RNA bằng cách theo dõi sự thay đổi dòng điện ion khi phân tử sinh học đi qua một lỗ nano có kích thước phân tử. Không giống các phương pháp giải trình tự dựa trên tổng hợp, nanopore không cần đánh dấu huỳnh quang hay chu trình hóa học lặp lại.

Trong bối cảnh sinh học phân tử hiện đại, giải trình tự nanopore được xếp vào nhóm công nghệ long-read sequencing, có khả năng đọc các đoạn trình tự dài hàng chục đến hàng trăm kilobase. Điều này giúp giảm đáng kể độ phức tạp trong lắp ráp hệ gen, đặc biệt đối với các vùng giàu lặp, tái tổ hợp hoặc cấu trúc phức tạp.

Giải trình tự nanopore được ứng dụng cho cả DNA và RNA, bao gồm cả giải trình tự RNA trực tiếp mà không cần bước phiên mã ngược. Khả năng này mang lại lợi thế trong nghiên cứu biểu hiện gen, biến đổi biểu sinh và cấu trúc phiên mã, những khía cạnh khó tiếp cận bằng các công nghệ giải trình tự truyền thống.

Nguyên lý hoạt động cơ bản

Nguyên lý cốt lõi của giải trình tự nanopore dựa trên hiện tượng dẫn điện ion qua một nanopore được gắn trong màng ngăn cách hai khoang dung dịch điện ly. Khi một hiệu điện thế được áp vào, dòng ion ổn định sẽ hình thành qua nanopore và được ghi nhận bởi hệ thống cảm biến điện tử.

Khi một phân tử DNA hoặc RNA được kéo qua nanopore nhờ động cơ enzyme, mỗi nucleotide hoặc nhóm nucleotide sẽ gây ra một mức cản trở khác nhau đối với dòng ion. Sự thay đổi này tạo ra tín hiệu điện đặc trưng theo thời gian, phản ánh trình tự các base đi qua nanopore.

Quá trình này có thể được tóm lược như sau:

  • Tạo dòng điện ion nền qua nanopore.
  • Đưa phân tử axit nucleic vào nanopore.
  • Ghi nhận tín hiệu dòng điện biến thiên.
  • Chuyển tín hiệu điện thành chuỗi nucleotide.

Tín hiệu thô thu được không trực tiếp là ký tự A, T, G, C mà là chuỗi giá trị dòng điện liên tục. Do đó, các mô hình học máy, đặc biệt là mạng nơ-ron sâu, được sử dụng để thực hiện bước basecalling với độ chính xác ngày càng được cải thiện.

Cấu trúc và vai trò của nanopore

Nanopore là thành phần trung tâm của công nghệ này, có thể được tạo từ protein sinh học hoặc vật liệu tổng hợp. Nanopore sinh học thường có nguồn gốc từ protein tạo lỗ của vi khuẩn, được biến đổi để đạt độ ổn định và độ phân giải tín hiệu phù hợp cho giải trình tự.

Các đặc tính quan trọng của nanopore bao gồm đường kính, chiều dài kênh dẫn và phân bố điện tích bên trong lỗ. Những yếu tố này quyết định khả năng phân biệt giữa các nucleotide và mức độ nhiễu tín hiệu. Một nanopore được thiết kế tối ưu sẽ tạo ra các mẫu dòng điện khác biệt rõ ràng cho từng tổ hợp base.

Bảng dưới đây so sánh hai loại nanopore thường được sử dụng:

Loại nanopore Nguồn gốc Đặc điểm chính
Sinh học Protein Độ phân giải cao, cần môi trường ổn định
Nhân tạo Vật liệu tổng hợp Độ bền cao, khả năng tùy chỉnh hình học

Các nghiên cứu về thiết kế và tối ưu nanopore đã được công bố rộng rãi trên các tạp chí chuyên ngành, ví dụ như Nature Biotechnology.

Quy trình giải trình tự nanopore

Quy trình giải trình tự nanopore bắt đầu bằng bước chuẩn bị mẫu, trong đó DNA hoặc RNA được tinh sạch và gắn các adapter đặc biệt để tương tác với enzyme điều khiển tốc độ di chuyển qua nanopore. Chất lượng mẫu đầu vào có ảnh hưởng trực tiếp đến độ dài đọc và độ chính xác của kết quả.

Sau khi chuẩn bị, mẫu được nạp vào flow cell chứa hàng nghìn nanopore hoạt động song song. Trong quá trình giải trình tự, dữ liệu được thu nhận theo thời gian thực, cho phép người dùng theo dõi tiến trình và dừng thí nghiệm khi đã đạt đủ độ phủ mong muốn.

Các bước chính trong quy trình có thể được khái quát như sau:

  1. Chuẩn bị và kiểm tra chất lượng mẫu.
  2. Gắn adapter và enzyme điều khiển.
  3. Nạp mẫu vào thiết bị giải trình tự.
  4. Thu nhận tín hiệu điện và xử lý dữ liệu.

Ưu điểm nổi bật của quy trình này là tính linh hoạt và khả năng triển khai nhanh, cho phép giải trình tự ngoài phòng thí nghiệm truyền thống, phục vụ các ứng dụng thực địa như giám sát dịch bệnh hoặc nghiên cứu môi trường.

Dữ liệu đầu ra và phân tích sinh tin học

Dữ liệu đầu ra của giải trình tự nanopore ban đầu tồn tại dưới dạng tín hiệu dòng điện thô (raw signal), phản ánh sự biến thiên cường độ dòng ion theo thời gian khi axit nucleic đi qua nanopore. Dữ liệu này khác căn bản so với dữ liệu hình ảnh hoặc tín hiệu huỳnh quang của các nền tảng giải trình tự truyền thống, đòi hỏi các phương pháp xử lý và phân tích chuyên biệt.

Bước đầu tiên trong phân tích sinh tin học là basecalling, tức chuyển đổi tín hiệu điện liên tục thành chuỗi nucleotide rời rạc. Hiện nay, các thuật toán basecalling chủ yếu dựa trên mô hình học sâu, có khả năng học các mẫu tín hiệu phức tạp và cải thiện độ chính xác theo thời gian khi dữ liệu huấn luyện ngày càng phong phú.

Sau basecalling, dữ liệu trình tự được sử dụng cho các phân tích tiếp theo như căn chỉnh với hệ gen tham chiếu, lắp ráp de novo, phát hiện biến dị hoặc phân tích methyl hóa. Hệ sinh thái phần mềm cho nanopore tương đối đa dạng và liên tục được cập nhật, với nhiều công cụ mã nguồn mở hỗ trợ các mục đích nghiên cứu khác nhau.

Ưu điểm của giải trình tự nanopore

Một trong những ưu điểm nổi bật nhất của giải trình tự nanopore là khả năng đọc trình tự rất dài, vượt trội so với các công nghệ short-read. Độ dài đọc lớn giúp giải quyết hiệu quả các vùng lặp, cấu trúc tái sắp xếp và các biến dị cấu trúc phức tạp trong hệ gen.

Công nghệ này cũng cho phép giải trình tự theo thời gian thực, nghĩa là dữ liệu được tạo ra và phân tích ngay trong quá trình thí nghiệm. Điều này đặc biệt hữu ích trong các tình huống cần phản hồi nhanh, chẳng hạn như giám sát dịch tễ học hoặc chẩn đoán bệnh truyền nhiễm tại hiện trường.

Các ưu điểm chính của giải trình tự nanopore có thể được tóm lược như sau:

  • Đọc trình tự dài với độ linh hoạt cao.
  • Không cần khuếch đại PCR, giảm sai lệch mẫu.
  • Khả năng phát hiện biến đổi biểu sinh trực tiếp.
  • Thiết bị nhỏ gọn, dễ triển khai ngoài phòng thí nghiệm.

Hạn chế và thách thức kỹ thuật

Bên cạnh các lợi thế, giải trình tự nanopore cũng tồn tại những hạn chế kỹ thuật cần được cân nhắc. Một trong những thách thức lớn nhất là tỷ lệ lỗi thô cao hơn so với các nền tảng short-read, đặc biệt trong các phiên bản công nghệ trước đây.

Độ chính xác của kết quả phụ thuộc mạnh vào chất lượng nanopore, enzyme điều khiển tốc độ và thuật toán basecalling. Mặc dù các cải tiến gần đây đã giúp giảm đáng kể tỷ lệ lỗi, việc xử lý và hiệu chỉnh dữ liệu vẫn là bước không thể thiếu trong các nghiên cứu yêu cầu độ chính xác cao.

Ngoài ra, giải trình tự nanopore tạo ra khối lượng dữ liệu lớn và liên tục, đòi hỏi hạ tầng tính toán phù hợp và kiến thức sinh tin học chuyên sâu để phân tích hiệu quả.

So sánh với các công nghệ giải trình tự khác

So với công nghệ Illumina, giải trình tự nanopore nổi bật ở khả năng đọc dài và giải trình tự thời gian thực, trong khi Illumina có ưu thế về độ chính xác cao và chi phí thấp trên mỗi base. Hai công nghệ này thường được xem là bổ sung cho nhau trong nhiều dự án nghiên cứu hệ gen.

Khi so sánh với PacBio, một nền tảng long-read khác, nanopore có lợi thế về thiết bị nhỏ gọn và khả năng triển khai linh hoạt, trong khi PacBio thường đạt độ chính xác cao hơn nhờ các chiến lược đọc lặp. Việc lựa chọn nền tảng phụ thuộc vào mục tiêu nghiên cứu, ngân sách và điều kiện triển khai.

Bảng dưới đây minh họa so sánh khái quát giữa một số công nghệ giải trình tự phổ biến:

Công nghệ Độ dài đọc Độ chính xác Tính di động
Nanopore Rất dài Trung bình đến cao Cao
Illumina Ngắn Rất cao Thấp
PacBio Dài Cao Trung bình

Ứng dụng trong nghiên cứu và y sinh học

Giải trình tự nanopore được ứng dụng rộng rãi trong nghiên cứu hệ gen, từ lắp ráp hệ gen hoàn chỉnh đến phát hiện biến dị cấu trúc và nghiên cứu tiến hóa. Khả năng đọc dài giúp làm sáng tỏ các vùng hệ gen trước đây khó tiếp cận.

Trong y sinh học, công nghệ này được sử dụng để giám sát dịch bệnh, xác định nhanh tác nhân gây bệnh và theo dõi sự lan truyền của virus trong cộng đồng. Ngoài ra, giải trình tự RNA trực tiếp mở ra hướng tiếp cận mới trong nghiên cứu biểu hiện gen và cơ chế điều hòa sau phiên mã.

Các ứng dụng thực tiễn đã được tổng hợp và đánh giá bởi National Center for Biotechnology Information.

Tài liệu tham khảo

  • Jain M., Olsen H.E., Paten B., Akeson M. The Oxford Nanopore MinION: delivery of nanopore sequencing to the genomics community. Genome Biology.
  • Deamer D., Akeson M., Branton D. Three decades of nanopore sequencing. Nature Biotechnology.
  • Oxford Nanopore Technologies. Nanopore Sequencing Overview. https://nanoporetech.com
  • National Center for Biotechnology Information. Nanopore sequencing applications. https://www.ncbi.nlm.nih.gov

Các bài báo, nghiên cứu, công bố khoa học về chủ đề giải trình tự nanopore:

Đặc trưng của các isoform phiên mã được chỉnh sửa bằng CRISPR ở mức độ đơn bào với công nghệ giải trình tự nanopore Dịch bởi AI
Genome Biology - Tập 22 - Trang 1-16 - 2021
Chúng tôi đã phát triển một phương pháp tiếp cận ở mức độ đơn bào để phát hiện cấu trúc phiên mã mRNA được chỉnh sửa bằng CRISPR. Phương pháp này đánh giá cách mà các biến thể gen tại các vị trí cắt nối và các yếu tố cắt nối góp phần vào các isoform mRNA thay thế. Chúng tôi xác định cách cắt nối thay thế được điều chỉnh bằng cách chỉnh sửa các đoạn exon-intron mục tiêu hoặc các yếu tố cắt nối bằng... hiện toàn bộ
#CRISPR #mRNA #phiên mã #isoform #cắt nối #giải trình tự nanopore
Xác định plasmid trong Escherichia coli liên quan đến gia cầm bằng cách sử dụng giải trình tự nanopore và Illumina Dịch bởi AI
Springer Science and Business Media LLC - Tập 24 - Trang 1-14 - 2023
Escherichia coli gây bệnh ở gia cầm (APEC) là tác nhân gây ra bệnh colibacillosis ở gà, một bệnh có ảnh hưởng kinh tế đáng kể đến ngành chăn nuôi gia cầm. Các plasmid lớn được phát hiện trong APEC được biết là có liên quan đến sự đa dạng chủng loại cho khả năng gây bệnh và kháng thuốc, nhưng có thể còn nhiều plasmid khác không được phát hiện trong phân tích tiêu chuẩn. Trong nghiên cứu này, chúng ... hiện toàn bộ
#Escherichia coli #plasmid #giải trình tự #bệnh colibacillosis #kháng thuốc
Phân tích và so sánh toàn diện giữa phương pháp giải trình tự RNA dựa trên PacBio và công nghệ nanopore đối với transcriptome của Arabidopsis Dịch bởi AI
Plant Methods - Tập 16 - Trang 1-13 - 2020
Số lượng các nghiên cứu sử dụng công nghệ giải trình tự thế hệ thứ ba, bao gồm Pacific Biosciences (PacBio) và Oxford Nanopore Technologies (ONT) đang gia tăng nhanh chóng trong nhiều lĩnh vực nghiên cứu khác nhau. Trong số đó, các nghiên cứu về transcriptome full-length single-molecule của thực vật chủ yếu sử dụng giải trình tự PacBio, trong khi ONT thì hiếm khi được sử dụng. Do đó, trong nghiên ... hiện toàn bộ
#giải trình tự RNA #PacBio #công nghệ nanopore #transcriptome #Arabidopsis
Giải quyết ở cấp độ loài của các amplicon gene 16S rRNA được giải trình tự qua máy giải trình tự nanopore cầm tay MinION™ Dịch bởi AI
Oxford University Press (OUP) - Tập 5 - Trang 1-9 - 2016
Máy giải trình tự DNA cầm tay và thu nhỏ MinION™ đã được phát hành cho cộng đồng khoa học trong khuôn khổ chương trình truy cập sớm để đánh giá ứng dụng của nó cho nhiều phương pháp di truyền khác nhau. Công nghệ này đã thể hiện tiềm năng lớn, đặc biệt trong các phân tích toàn bộ hệ gen. Trong nghiên cứu này, chúng tôi đã kiểm tra khả năng của hệ thống MinION™ trong việc thực hiện giải trình tự am... hiện toàn bộ
#giải trình tự DNA #vi sinh vật #đa dạng vi sinh vật #máy giải trình tự cầm tay #amplicon 16S rRNA #giải trình tự nanopore
Kết nối gia súc: dịch tễ học phân tử của các đợt bùng phát BVDV qua việc giải trình tự toàn bộ genome nhanh chóng bằng công nghệ nanopore trên các mẫu lâm sàng Dịch bởi AI
Springer Science and Business Media LLC - Tập 17 - Trang 1-10 - 2021
Virus tiêu chảy virus bò (BVDV) là một tác nhân gây bệnh nhai lại toàn cầu, chịu trách nhiệm cho bệnh Tiêu chảy Virus Bò với nhiều biểu hiện lâm sàng khác nhau và gây thiệt hại kinh tế nghiêm trọng trên toàn thế giới. Được phân loại trong chi Pestivirus, loài Pestivirus A và B (còn gọi là BVDV-1, BVDV-2) được phân tách gen thành 21 kiểu BVDV-1 và bốn kiểu BVDV-2. Thông thường, vùng không dịch mã 5... hiện toàn bộ
#BVDV #virus tiêu chảy virus bò #dịch tễ học phân tử #giải trình tự toàn bộ genome #nanopore sequencing
Phát hiện các yếu tố di chuyển hoạt động trong Arabidopsis thaliana sử dụng công nghệ Giải trình tự Oxford Nanopore Dịch bởi AI
Springer Science and Business Media LLC - Tập 18 - Trang 1-8 - 2017
Các yếu tố di chuyển (TE) góp phần vào cả động lực cấu trúc và chức năng của hầu hết các bộ gen eukaryote. Do tính khả năng dày đặc của chúng trong các bộ gen thực vật và động vật, việc ước lượng chính xác tác động của sự chuyển vị đến đa dạng bộ gen đã được coi là một trong những thách thức chính của bộ gen học hiện nay. Sự phát triển gần đây của công nghệ NGS (giải trình tự thế hệ tiếp theo) đã ... hiện toàn bộ
#yếu tố di chuyển #kỹ thuật giải trình tự #Arabidopsis thaliana #NGS #đa dạng gen
Tổng số: 6   
  • 1